IBMは、WEBサーチとは異なるアルゴリズムを持つ、企業内専用の検索エンジンをリリースした。
コードネームは「Masala(マサラ)」。紅茶によく使われるインドのスパイスのことだ。ということは、インドに開発拠点を置いていたということだろう。
通常、検索においては、まずキーワードをヒットさせるための全文検索が行われ、そのあとでヒットした情報の掲載順序を決定づける(重みづける)ためのリスティングが行われる。この重みづけの根拠となる様々な論理や定義付けのことを検索のアルゴリズムとよぶ。
WEBの検索では、たいていの場合、Googleに代表されるように、リンクされている数やYahooのようなポータルからリンクを受けていることなどの、リンク情報をアルゴリズムの基礎においていることが多い(=PageRank)。ところが、企業のイントラネットでは、インターネットにおける、WEB同士の複雑なリンクがほとんど存在しないし、HTMLだけでなく、WordやExcelといった様々な形式のファイルが存在し、それらを発見することの方がより重要であったりするので、通常のWEB検索技術を企業内に持ち込んでもあまり意味をなさないことが多い。
この「Masala」において、どのようなアルゴリズムを用いているのかは分からないが、独自思想によるものであることは間違いない。
ところで、検索には更に、YahooやGoogleにおけるような、検索エンジン(ロボット検索)を使うケースと、RDB(データベース)による検索の二つに大別できる。RDBによる検索は強力だが、構築までの時間が長く、構築してからのメンテナンスの煩雑さや、増大するデーター数への対応にコストがかかることで、最近は敬遠されるケースが多い。ところが「Masala」は検索エンジンとRDB検索のハイブリッド型であるというので、非常に興味をそそられている。
コメント